import matplotlib.pyplot as plt
import os
import re
import shutil
import string
import tensorflow as tf

from tensorflow.keras import layers
from tensorflow.keras import losses

# 定义一个指向数据压缩包的网络地址
url = "https://ai.stanford.edu/~amaas/data/sentiment/aclImdb_v1.tar.gz"

# tf.keras.utils.get_file 是 TensorFlow 提供的一个工具函数，作用是：
# 从 URL 下载文件，默认会把下载的文件缓存到 ~/.keras/datasets，这里改成了当前目录（cache_dir='.'）。
dataset = tf.keras.utils.get_file("aclImdb_v1", # 给下载的文件起一个名字，没有后缀会自动添加原始后缀
                                  url, # 要下载的网络地址
                                  untar=True, # 下载后自动解压
                                  cache_dir='.', # 文件保存的目录，这里设置为了当前目录
                                  cache_subdir='') # 表示不要在目录中创建文件夹，直接保存到这个目录中

# tf.keras.utils.get_file() 函数运行完会返回解压后文件夹的父路径。


dataset_dir = os.path.join(os.path.dirname(dataset), 'aclImdb')

# 创建训练集和测试集的目录
remove_dir = os.path.join(train_dir, 'unsup')
shutil.rmtree(remove_dir)

